深层网络:揭示网络中隐藏的价值 World Wide Web(简称WWW,或Web...Web网按其分布状况可以分为“表层网”(Surface Web)和“深层网”(Deep Web,也有称Invisible Web,HiddenWeb)。 Surface Web指存储在Web
Deep Web查询接口模式抽取方法研究,朱会峰,左万利,通过对查询接口内部编码和视觉单元信息的研究,提出了Deep Web查询接口模式抽取方法。首先,设计启发式规则对含有查询接口表单的HTML
deepweb_百度百科http://baike.baidu.com/view/3783784.htm Deep Web(深层网络or深度网络) - elaine‘s workshop - 博客频道 - CSDN.NEThttp://blog.csdn.net/heavenying/article/details/1647538 深度...
随着Web的发展,越来越多的数据可以通过表单提交来获取,这些表单提交所产生信息是由Deep Web后台数据库动态产生的。在这种情况下,信息集成就更加需要Web爬虫来自动获取这些页面以进一步地处理数据。为了帮助用户...
针对《基础教育教学资源元数据应用规范》中资源建设标准的缺陷,提出一种基于Deep Web集成技术的教育资源跨库检索系统设计方案。该系统包含知识发现、集成查询、知识库和系统监控等模块,加入了环境变化监控构件,并...
研究如何准确快速获取DeepWeb网络资源.提出了一种基于主题的DeepWeb聚焦爬虫框架,该框架主要包含了爬行模块、网页分类模块、链接解析模块和查询接口判别模块4大模块.实验结果表明,该爬虫的爬行策略取得了很好的...
基于层次树模型的Deep Web数据提取方法
基于本体的Deep Web查询接口集成
针对煤炭监测数据的复杂多变性及Deep Web数据查询结果网页描述信息的特点,提出了一种基于蚂蚁算法和本体指导网页信息抽取的方法。首先构建基于简单本体的数据抽取系统,通过对结果页面中包含本体语义信息的数据的映像...
为突破这种局限,引入了基于表单元件统计特征的Deep Web入口探测方法和使用文本分类方法对其进行分类的双层分类模型,并提出了两种特征权重计算方法用于特征选取。在TEL-8 Query Interfaces数据集上,测试结果体现了...
Deep Web结果页面大多由网站根据请求从后台数据库读取数据并动态填充到通用模板而生成的。研究如何从一系列同模板生成的页面中生成该模板,并利用模板自动抽取数据。给出了模板生成问题的形式化描述,提出了一种新颖...
DeepWeb 数据采集查询构造方法研究
Deep Web中蕴含着丰富的高质量的信息,通过Deep Web集成查询接口可以获取到包含这些信息的结果页面,因此,Deep Web查询结果页面的数据抽取成为Deep Web数据集成的关键。提出了将索引方法和编辑相似度相结合的方法,...
提出了一种结合页面视觉信息和标签信息来提取页面内容结构的方法――DVS。DVS首先通过分析页面的CSS样式信息、DOM树以获得页面的视觉信息和标签信息,初步得到页面的视觉树;然后利用树的路径相似算法,既考虑标签...
针对数据源新产生数据记录的增量爬取问题,提出了一种deep Web 新数据发现策略,该策略采用一种新的属性值序列图模型表示deep Web 数据源,将新数据发现问题转化为属性值序列图的遍历问题,该模型仅与数据相关,与...
您首选的面向deep web的开源爬虫程序。
针对数据源新产生数据记录的增量爬取问题,提出了一种deep Web 新数据发现策略,该策略采用一种新的属性值序列图模型表示deep Web 数据源,将新数据发现问题转化为属性值序列图的遍历问题,该模型仅与数据相关,与...
Deep Web蕴藏着海量信息,现有的搜索引擎很难挖掘到其中的内容。如何充分地获取Deep Web中有价值的信息成为一个难题。提出了基于语义相似度计算的Deep Web数据查询方法,该方法通过语义相似度计算作为中间件,计算出...
提出了一种基于Dirichlet过程的Deep Web数据源聚类方法,该方法采用层次Dirichlet过程(HDP)进行特征提取。首先将查询接口中原本高维稀疏的文本表示为主题特征,该过程能自动确定特征数。然后将文本看成多项式模型...
如何高效、准确地组织和检索Deep Web蕴含的高质量信息已经成为未来Web挖掘和数据库领域面临的一项崭新课题和挑战,而Deep Web分类则是Deep Web信息检索的基础.该论文综合论述了Deep Web信息集成的研究概况,重点...
一种基于知识工程的DeepWeb信息抽取方法.pdf
首先通过结果页面解析和抽取结构化数据来完成数据预处理的工作,并在集成结果模式和待标注数据之间建立正确的语义映射,进而确定DeepWeb数据的标注信息。通过对4个领域Web数据库进行实验测试,结果表明所提方法能...
针对现有Deep Web信息集成系统没有考虑查询接口动态性的特点,造成本地接口与网络接口查询能力不对等的问题,提出一种基于演化版本的Deep Web查询接口维护方法。该方法通过构建本地接口的版本化模型来刻画接口的增量...
为了用户方便快速地使用Deep Web中的信息,对在线数据库中的内容进行获取是一种行之有效的方法。...通过实验证明,该方法能有效地获取Deep Web中的大部分内容,用户可以通过搜索引擎更快更方便地查询DeepWeb中的信息。
A great deal of data on the Web lies in the hidden databases, or the deep Web. Most of the deep Web data is not directly available and can only be accessed through the query interfaces. Current ...
DeepWeb信息抽取系统的研究与实现
随着Internet信息的迅速增长与网络技术的不断进步,越来越多的数据库可以通过网络查询接口直接访问,包含这种类型数据库的Web被称为Deep Web。互联网中的Deep Web数据存储量非常庞大,而其中大部分是电子商务数据。...
基于本体的Deep Web数据源的分类研究
获取Deep Web中信息的主要途径是通过在其提供的查询接口上提交查询来实现的,目前大部分的研究以表单内的<form></form>标签获得表单内容结构,判断是不是一个Deep Web查询接口。提出了接口块的概念,设计了...